DataQuery 개요

  • 분산 SQL 쿼리 엔진 Trino를 기반으로 대규모 데이터에 대해 쿼리를 실행할 수 있는 서비스 입니다.
  • Object Storage 등 NHN Cloud 서비스와의 연동을 지원합니다.

주요 기능

  • NHN Cloud Object Storage, NHN Cloud RDS for MySQL 등 데이터 소스들에 대한 연결을 지원합니다.
  • 각각 다른 데이터 소스들에 대해 표준 SQL로 통합 쿼리 실행이 가능합니다.
  • 웹 콘솔 내에서 쿼리 실행이 가능합니다.
  • 웹 콘솔 쿼리 결과에 대해 프리뷰 및 다운로드 기능을 제공합니다.
  • 실행 중이거나 완료된 쿼리에 대한 정보 및 히스토리를 제공합니다.
  • Trino 엔드포인트를 통해 UI 접속 및 외부 툴(JDBC, CLI, BI 솔루션 등)과의 연동이 가능합니다.
  • 사용자 프로젝트별 Trino 클러스터를 제공하며 필요 시 사양 조정이 가능합니다.

서비스 용어

용어 설명
데이터 소스 DataQuery에서 사용하기 위한 데이터베이스 또는 데이터 집합체를 의미합니다.
카탈로그 스키마를 포함하고 있으며, 커넥터를 통해 데이터 소스를 참조하는 역할을 합니다.
스키마 테이블을 구성하고 카탈로그와 함께 쿼리 가능한 테이블을 정의합니다. 일반적인 RDBMS에서의 DB와 동일한 개념입니다.
테이블 행과 열로 이루어진 데이터의 집합입니다.
클러스터 Trino 클러스터를 의미합니다.
TOP